其他
生信一瞥 | 表观遗传学常用工具及数据库简介
1. 给浏览基因组数据提供了可靠和迅速的方式。
2. 数据来源:约有一半的注释信息是 UCSC 通过来自公开的序列数据计算得出,另外一半来自世界各地的科学工作者。3. 本身并不下任何结论,只是收集各种相关信息供用户参考。4. 支持数据库检索和序列相似性搜索。
Dense:所有信息都在一条直线里显示出来。如果你快速的浏览多个基因的话,或者你要是筛选很多的 tracks 同时看的时候,这是一种相对节约空间的模式。Full:如果你想选 full 这种模式,它每一种 isoform 就是一行,这样它一个基因就会占用你页面里很长的长度。除非你想深入研究某个关注的基因,才选择这种方式。Pack:每一项都单独显示,如果有一些项目比较短,后面就会接上其他的,这种方式可以尽量合理地填充整个页面的空白。Squish:这种模式和 pack 类似,但是是一种压缩模式,高度只有整个 pack 模式的一半,不能看得很细。
在 UCSC 里面,通常我们自己会有一些特殊处理的组织或是自己构建的特殊处理的样本的测序数据。这样我分析完以后,我的背景数据库里面没有,我怎么看?比如说我的数据都 map 完了,我现在有一种特殊处理的样本,处理前后的样本做了 RNA-seq,并且做了差异表达分析。做完差异表达以后,我怎么在这个上面看?这就是在 Genome Browser 里面有一个 add custom tracks,这个地方可以上传你自己的数据。
ENCODE 计划里面的数据我怎么下载呢?这个部分我们会经常用到 Table Browser。
2. 用文本形式来获取存储在 Genome Browser 数据库中的基因组汇编和注释数据;
3. 为整条染色体或一些特定的序列获取 DNA 序列信息或注释信息;
4. 用特定的条件对输出结果进行筛选;
5. 创建自己的路径,并且在 Genome Browser 中可视化地显示出来;
6. 整合多重查询,并为其产生相关的输出;
7. 为选定的数据集提供基本的统计结果;
8. 显示一个数据表格的详细情况,并且列出在数据库中与其相关的所有表格;
9. 根据其它应用程序和数据库的要求,对输出结果进行格式化。
● 通过这个工具可以找到蛋白水平的的相似性、基因表达谱的相似性或是基因组的相似性。
Roadmap server
http://epigenomegateway.wustl.edu/support/HandoutforWashUEpigenomeBrowserdemo.pdf
https://www.genome.gov/Pages/Research/ENCODE/Tutorials/2016-03-17_SoT_WashU_Epigenome_Browser_Tutorial_Wang.pdf
我想分享给大家做 RNA-seq 分析的基本步骤、关键步骤、主流方法和较新的方法。我们实验室的科研模式是倾向于先有想法,然后通过已发表的数据去验证想法是否正确,验证预期结果是否有效,这时会涉及到如何使用数据库提供的或是别人已经发表的数据来验证自己的想法。
通常公司把数据给你,或者我们自己下载了数据之后,我们首先要评估一下 QC,或者说评价一下数据质量好不好,那么怎么评估数据质量好不好呢?这里有一个使用起来相对简单的工具——fastq QC,但它不是最好的工具,只是它的操作比较简单。如果说你有 Linux 系统的话,可以直接把你关注的数据选进去就行了。
Part 3 : 表观遗传学常用软件及网站的介绍
接下来为大家分享一些表观遗传分析过程中常用的数据库,希望大家通过这个部分了解自己研究的领域有哪些资源可以用,以下数据库可能不是最好的,但都是比较常用的。
1. MethDB: http://www.methdb.de
2. PubMeth http://www.pubmeth.org
3. DaseMeth http://bioinfo.hrbmu.edu.cn/diseasemeth
1. HIstome: The Histone Infobase
2. Human Histone Modification Database
1. miRBase http://www.mirbase.org/
2. miRWalk2 http://zmf.umm.uni-heidelberg.de/apps/zmf/mirwalk2/
4. The human microRNA disease database
5. Mir2subpathway
6. Transcriptional factor and miRNA regulatory cascade http://210.46.85.180:8080/TMREC/
1. LNCipedia database https://lncipedia.org/
2. TheLncRNA and Disease Database
3. NONCODE http://www.noncode.org/